Навигация
Главная
Новости
Ресурсы
 Книги
 Справочники
 Статьи
Файловый архив
 Журналы
 Книги
 Справочники
 Просто софт
 Софт по электронике
Обратная связь
Карта сайта

СКБ КриптоНет


Книги

Уважаемый читатель!
Публикация данного документа не преследует за собой никакой коммерческой выгоды. Но такие документы способствуют профессиональному и духовному росту читателей и являются рекламой бумажных изданий таких документов. Все авторские права сохраняются за правообладателем.
За содержание книги ответственность несут ее авторы.

Архивация данных и программы сжатия

Программы-архиваторы можно разделить на три категории.

  1. 1. Программы, используемые для сжатия исполняемых файлов, причем все файлы, которые прошли сжатие, свободно запускаются, но изменение их содержимого, например русификация, возможны только после их разар- хивации.
  2. 2. Программы, используемые для сжатия мультимедийных файлов, причем можно после сжатия эти файлы свободно использовать, хотя, как прави ло, при сжатии изменяется их формат (внутренняя структура), а иногда и ассоциируемая с ними программа, что может привести к проблемам с за пуском.
  3. 3. Программы, используемые для сжатия любых видов файлов и каталогов, причем в основном использование сжатых файлов возможно только по сле разархивации. Хотя имеются программы, которые "видят" некоторые типы архивов как самые обычные каталоги, но они имеют ряд неприят ных нюансов, например, сильно нагружают центральный процессор, что исключает их использование на "слабых машинах".

Принцип работы архиваторов основан на поиске в файле "избыточной" ин формации и последующем ее кодировании с целью получения минималь ного объема. Самым известным методом архивации файлов является сжатие последовательностей одинаковых символов. Например, внутри вашего файла находятся последовательности байтов, которые часто повторяются. Вместо того, чтобы хранить каждый байт, фиксируется количество повторяемых символов и их позиция. Например, архивируемый файл занимает 15 байт и состоит из следующих символов:

В В В В В LLLLLAAAAA

В шестнадцатеричной системе

42 42 42 42 42 4С 4С 4С 4С 4С 41 41 41 41 41

Архиватор может представить этот файл в следующем виде (шестнадцате-ричном):

01 05 42 06 05 4С 0А 05 41

Это значит: с первой позиции пять раз повторяется символ "В", с позиции 6 пять раз повторяется символ " L " и с позиции 11 пять раз повторяется сим вол "А". Для хранения файла в такой форме потребуется всего 9 байт, что на 6 байт меньше исходного.

Описанный метод является простым и очень эффективным способом сжа тия файлов. Однако он не обеспечивает большой экономии объема, если обрабатываемый текст содержит небольшое количество последовательностей повторяющихся символов.

Более изощренный метод сжатия данных, используемый в том или ином виде практически любым архиватором, — это так называемый оптимальный префиксный код и, в частности, кодирование символами переменной длины (алгоритм Хаффмана).

Код переменной длины позволяет записывать наиболее часто встречающиеся символы и группы символов всего лишь несколькими битами, в то время как редкие символы и фразы будут записаны более длинными битовыми строками. Например, в любом английском тексте буква Е встречается чаще, чем Z , а X и Q относятся к наименее встречающимся. Таким образом, ис пользуя специальную таблицу соответствия, можно закодировать каждую букву Е меньшим числом битов и использовать более длинный код для бо лее редких букв. Популярные архиваторы ARJ , РАК, PKZIP работают на основе алгоритма Лемпела-Зива. Эти архиваторы классифицируются как адаптивные словарные кодировщики, в которых текстовые строки заменяются указателями на идентичные им строки, встречающиеся ранее в тексте. Например, все слова какой- нибудь книги могут быть представлены в виде номеров страниц и номеров строк некоторого словаря. Важнейшей отличительной чертой этого алгоритма является использование грамматического разбора предшествующего текста с расположением его на фразы, которые записываются в словарь. Указатели позволяют сделать ссылки на любую фразу в окне установленного размера, предшествующего текущей фразе. Если соответствие найдено, текущая фраза заменяется указателем на своего предыдущего двойника.

При архивации, как и при компрессировании, степень сжатия файлов силь но зависит от формата файла. Графические файлы, типа TIF и GIF , уже за ранее компрессированы (хотя существует разновидность формата TIFF и без компрессии), и здесь даже самый лучший архиватор мало чего найдет для упаковки. Совсем другая картина наблюдается при архивации текстовых файлов, файлов PostScript , файлов BMP и им подобных.


Если Вы найдете какие либо опечатки, ошибки или подозрительные неточности то обязательно сообщите об этом администрацию сайта (Сделать это можно здесь)


[ Вернуться назад ]

ТОП 10
Файлы:

  1. Карманный справочник по электронике
  2. Цифровая схемотехника
  3. Азбука разработчика цифровых устройств
  4. sPlan или RusPlan v.6.0.0.1
  5. Основы теории цепей
  6. Основы языка VHDL
  7. Справочник по полупроводниковым приборам
  8. UNILOGIC - Логический анализатор для PC
  9. Справочник по расчету параметров катушек индуктивности
  10. Программирование однокристальных микропроцессоров



Новости:

  1. В 3D-принтере лазер заменили солнечным лучом
  2. Нановолокна упростят лечение рака
  3. Квантовый компьютер: IBM переходит к практике
  4. Конференции «Форум разработчиков цифровой электроники»
  5. Магнитогорские андроиды завоюют российский рынок
  6. Создана "глушилка" болтунов, теперь там где надо будет тихо
  7. Создан компактный ветрогенератор на пьезоэлементах
  8. Робот-гепард поставил рекорд скорости
  9. Механическая рука DARPA удивляет ловкостью
  10. Создан пульт дистанционного управления мозгом

Электроника это просто1
Copyright © electronic.com.ua 2007-2024